在图像生成的领域中,从视觉提示中创建自定义的图像,并以其他文本指令的形式出现作为有希望的努力。然而,除去基于调整和不含调整的方法,与解释视觉提示的主题属性的斗争。这会导致主题 - 略带属性渗透到生成过程,最终损害了编辑性和ID保存中的人性化质量。在本文中,我们提出了Disenvisioner,这是一种新颖的方法,用于在过滤出irrelevant信息的同时有效地提取和丰富主题的特征,以无调的方式启用出色的自定义性能,并且仅使用单个图像。具体来说,该主题和其他无关组件的特征被有效地分为独特的视觉令牌,从而实现了更准确的自定义。,为了进一步提高ID的一致性,我们丰富了分离的特征,将它们雕刻成更精细的代表。实验证明了我们的方法优于教学响应(编辑性),ID一致性,推理速度和整体图像质量中现有方法的优越性,从而突出了贬低者的有效性和效率。项目页面:disenvisioner.github.io。
主要关键词
![arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第1页](/bimg/3/37fd32d604bf751d01ab6948711d677aae31d613.webp)
![arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第2页](/bimg/a/af85701240b82db334e9e17d9edf60257a80393a.webp)
![arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第3页](/bimg/f/f8b6223fc66aa22a81ac548865aa1695de6039e5.webp)
![arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第4页](/bimg/e/ef92965f231a76f91a9c709226ee5843b8deb005.webp)
![arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第5页](/bimg/2/22178b87e1582d4e1c1c272aef29c042fdd31128.webp)
